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Мультиагентный метод с непрямой связью 
между агентами для выделения 
информативных признаков 


Решена задача отбора информативных признаков. Предложены мультиагентные методы отбора 
информативных признаков с непрямой связью между агентами на основе представления пунктов 
назначения признаками и в виде информативности. Проведены эксперименты по решению задачи отбора 
информативных признаков для моделирования коэффициента упрочнения деталей газотурбинных 
авиадвигателей после алмазного выглаживания. 


Введение 


Главной целью отбора информативных признаков является выделение минималь- 
ного подмножества признаков из проблемной области, которое обеспечивало бы тре- 
буемую точность описания экземпляров относительно набора первоначально заданных 
признаков [1]. При решении прикладных задач отбор информативных признаков не- 
обходим для исключения нерелевантных, малоинформативных признаков, а также 
признаков, являющихся следствием шумов. За счёт удаления таких признаков работа 
методов обработки данных, которые используются при моделировании сложных объек- 
тов и систем, может выполняться значительно быстрее. 


Постановка задачи 


Пусть задано множество признаков Х = {х1,хо,..,х„} размерности и. Тогда задача 
отбора информативных признаков [2] заключается в поиске такого набора признаков 
Х* из всего возможного множества 2” наборов-кандидатов, критерий оптимальности 
для которого находился бы в допустимых пределах: 

=, 
где = (Х*) — значение критерия оптимальности для набора признаков Х*; &„ — порого- 
вое значение критерия оптимальности. 

Обычно методы отбора информативных признаков используют либо технику эв- 
ристического поиска [1], [2], либо технику случайного поиска [1], [2] для снижения 
вычислительной сложности. Однако при таком подходе часто уменьшается уровень 
оптимальности отобранного набора информативных признаков. В связи с этим в дан- 
ной работе предлагается применять мультиагентный метод с непрямой связью между 
агентами [3], [4], поскольку он позволяет решать различные задачи дискретной опти- 
мизации, к которым может быть отнесена и задача отбора информативных призна- 
ков. При этом оптимизационный процесс характеризуется меньшей вычислительной 
сложностью, чем у методов полного или сокращённого перебора, а также мультиагентный 
метод с непрямой связью между агентами обеспечивает требуемую точность резуль- 
тирующего решения [3-9]. 
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Применение метода муравьиных колоний к решению 
задачи отбора информативных признаков 


Метод муравьиных колоний является эвристическим, итеративным методом 
случайного поиска, основанным на моделировании поведения агентов (муравьёв) в 
процессе решения ими оптимизационных задач [3], [4]. Данный метод основан на 
мультиагентном подходе с непрямой связью между агентами, которая достигается за 
счёт моделирования меры приоритетности граней в графе поиска. Метод широко при- 
меняется для решения различных задач дискретной оптимизации, например, задачи 
коммивояжёра, задачи календарного планирования и т.п. [5-8]. Однако в общем слу- 
чае метод муравьиных колоний может быть применен к любой комбинаторной задаче, 
которая согласуется со следующими требованиями: 

— соответствующее представление задачи — задача должна быть описана в виде гра- 
фа с набором узлов и граней между узлами; 

— эвристическая пригодность граней — возможность применения эвристической меры 
адекватности путей от одного узла к каждому соседнему узлу в графе; 

— составление альтернативных решений, посредством чего можно рационально опре- 
делять допустимые решения; 

— правило обновления феромонов -— правило, которое определяет вероятность переме- 
щения агента из одного узла графа к другому. 

Задача отбора информативных признаков может быть представлена в виде, соот- 
ветствующем методу муравьиных колоний. Модификации метода муравьиных колоний 
для решения задачи отбора информативных признаков заключаются в том, что задача 
представляется в виде графа, узлы которого характеризуют признаки, а грани между 
ними — выбор следующего признака. 

Для решения задачи отбора информативных признаков предлагается использо- 
вать два метода, основанные на мультиагентном подходе с непрямой связью между 
агентами: мультиагентный метод на основе представления пунктов назначения призна- 
ками и метод на основе представления пунктов назначения в виде информативности 
признаков. 


Мультиагентный метод отбора информативных 
признаков с непрямой связью между агентами на основе 
представления пунктов назначения признаками 


Основная идея данного метода в аспекте решения задачи отбора признаков заклю- 
чается в следующем: предполагается, что агент должен совершить путь по заданному 
количеству пунктов назначения и, при этом каждому пункту ставится в соответствие 
признак х, {= Ъп; тогда путь, пройденный агентом, составляет набор признаков Н, 
который предлагается использовать для построения модели. При этом данные хранятся 
не в битовом виде, а в виде номеров отобранных признаков / = 1, и. При получении ито- 
гового результата это позволяет получать оценку степени влияния каждого признака. 

Шаг 1. Задать параметры метода: миРй — начальное количество феромона; р — 
коэффициент количества феромона, которое агент оставляет на пути, где (1 — р) по- 
казывает коэффициент испарения феромона на пути после его завершения; О -— кон- 
станту, относящуюся к количеству феромона, которое было оставлено на пути; ШСЁ — 
количество признаков в исходном наборе; ошСЁЕ — количество признаков, которое 
следует оставить в сокращённом наборе. 
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Шаг 2. Инициализация. Создание популяции агентов. После создания популя- 
ция агентов поровну распределяется по пунктам назначения. 

Шаг 3. Движение агентов. Если агент еще не закончил путь, то есть не посетил 
пункты в количестве, равном ош СХ, для определения следующего пункта в пути агента 
используется вероятность: 


Тк (1) 


п/ 

У @-+ть (0 
Ри 
где Рь — вероятность того, что /-й агент, который ещё не посетил и’ пунктов, для про- 
должения пути выберет пункт (К; т(1) — количество феромона в 1-ом пункте в момент 
времени [. 

Агент перемещается только в пункты, которые еще не были посещены (как ука- 
зано списком табу Ил51). Поэтому вероятность Р/ рассчитывается только для пунктов, 
которые ещё не были посещены агентом. 

Шаг 3 повторяется до тех пор, пока каждый агент не закончит свой путь. Путь счи- 
тается пройденным до конца, когда агент посетит пункты в количестве, равном ошСЁ. 


Е. 


В, = 


Шаг 4. На основе пунктов, посещённых агентом, строится модель Е(Х°°®) и 
для неё определяется ошибка =;. 

Шаг 4.1. Последовательность номеров узлов, посещённых агентом, переводится 
в битовую строку Р!/ по формуле: 


0, если 1 [7; 
А: = 


| 1, если 1 М, 
где а; — /-й бит в битовой строке; /— номер узла; //— путь /-го агента. 
Шаг 4.2. На основе полученной битовой строки Ни экспериментальных данных 
строится модель (например, на основе регрессии или нейросети). 
Шаг 4.3. Рассчитывается ошибка =; для полученной модели: 
М 
АХ — У; раи)* > 
где у; — исходные значения выходной переменной; у/ рас. — расчётное значение вы- 
ходной переменной по построенной модели; №- количество экспериментов. 
Шаг 5. Определяется количество феромона, которое было оставлено в каждом 
пункте пути для /-го агента: 


&)— 


4$! (= 9, 


ое 
где Лт(® — количество феромонов, которое надо добавить каждому пункту, входящему 
в путь /-го агента в момент времени (; О — параметр, понижающий степень влияния 
ошибки модели =, построенной на основании признаков, входящих в путь /-го агента. 
Затем Д?(® используется для расчёта того, насколько требуется увеличить ко- 
личество феромона для каждого пункта, в котором побывал агент: 


м 
т =т@-О+р.> Аг; (0), 
т 
где №- количество агентов, выбравших 1-й признак. 

Данная формула применяется ко всему пути, при этом каждый пункт помечается 
феромоном пропорционально ошибке полученной модели. Поэтому следует дождаться, 
пока агент закончит путешествие, и только потом обновить уровни феромона, в про- 
тивном случае истинная длина пути останется неизвестной. 
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В начале пути у каждого пункта есть шанс быть выбранным. Чтобы постепенно 
удалить пункты, которые входят в худшие комбинации, ко всем путям применяется 
процедура испарения феромона: 

г =т-@-р). 

Шаг 6. Проверка на достижение оптимального результата. Результат считается 

оптимальным, если: 


— достигнуто максимальное количество итераций: РЕЕ 


шах , 
— полученный результат находится в допустимом пределе: &„ Еды 


гереа! 


— на протяжении сиЁ, 


итераций не было отмечено изменений в выборе наилучшего 


решения. 

Если проверка дала положительный результат, то происходит окончание работы 
метода (переход к шагу 7), в противном случае — переход к шагу 6. 

Шаг 7. Повторный запуск. После того, как путь агента завершен, грани обнов- 
лены в соответствии с длиной пути и произошло испарение феромона на всех гранях, 
метод выполняется повторно. Список табу очищается, и длина пути обнуляется. Аген- 
там разрешается перемещаться по сети. Переход к шагу 3. 

Шаг 8. Останов. Определяется лучший путь, который является решением. Лучший 
путь выбирается путём сравнения ошибок моделей, которые рассчитываются по прин- 
ципу, описанному на шаге 4. 

Шаг 9. После останова и выбора наилучшего пути строится финальная модель, 
что позволяет обеспечить требуемую точность при меньшем количестве признаков, чем 
в исходном наборе. 

Таким образом, предложенный метод на основе представления пунктов назначе- 
ния признаками позволяет решать задачу отбора информативных признаков за счёт 
приведения задачи отбора информативных признаков в вид, соответствующий концеп- 
ции работы мультиагентного подхода с непрямой связью между агентами. При этом 
основной особенностью предложенного метода является то, что пункт назначения в 
графе поиска представляет собой признак, который предлагается принять как инфор- 
мативный. Поскольку в процессе работы мера приоритетности каждого узла изменя- 
ется, то за счёт такого подхода можно выделить не только наиболее информативные 
признаки, а также и выяснить относительную важность каждого из них. 


Мультиагентный метод отбора информативных 
признаков на основе представления пунктов назначения 
в виде информативности признаков 


Особенностью данного метода является то, что пунктам назначения (1, п), где 
п — количество входных признаков СЕ, ставится в соответствие двоичный набор 
В= {Ь, | Б,= <0;1>, 1 =Ъп }, формируемый случайно, и при этом количество единичных 
элементов должно быть равным количеству признаков ои!СЕ, которые необходимо 
оставить. Каждый агент должен совершить путь по всем пунктам назначения, после 
чего по полученному пути строится модель в соответствии с двоичным набором В. 

Основные шаги данной модификации приведены ниже. 

Шаг 1. Задать параметры метода: © — коэффициент, определяющий относитель- 
ную значимость пути (количество феромона на пути); тИРИ — начальное количество 
феромона; р — коэффициент количества феромона, которое агент оставляет на пути, 
где (1- р) показывает коэффициент испарения феромона на пути после его заверше- 
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ния; © -— константу, относящуюся к количеству феромона, которое было оставлено на 
пути; СЕ — количество признаков в исходном наборе; ошСЕ — количество признаков, 
которое следует оставить в сокращённом наборе, тахТите — максимальное время мо- 
делирования. Установить время моделирования си’Тите в 0. 

Шаг 2. Инициализация. Создание двоичного набора В и популяции агентов. Дво- 
ичный набор В следует создавать случайным образом. Предлагается получить ой СЕ 


целых случайных чисел № ит, (7 = ТошСЕР ) в интервале [1; тСЁ] и каждому Бит, 
. 


присвоить 1, остальные элементы р, принять равными 0. Количество агентов в популя- 
ции азетСи! предлагается выбирать не меньшим количества признаков СР. После 
создания популяция агентов поровну распределяется по пунктам назначения. 

Шаг 3. Изменение количества времени моделирования: си’Тите = сигТите + 1. 

Шаг 4. Движение агентов. Каждый агент, пока не закончит весь путь, выбирает 
следующий пункт назначения. При этом при выборе следующего пункта учитывает- 
ся количество феромона, уже оставленного в этом пункте, и количество феромона, 
оставленного в других пунктах, ещё не посещённых агентом. Добавление пункта А в 
путь /-го агента происходит с вероятностью: 


Тк (1) 


Р 7 (2) = > 
№ (К-т к (И 
ри . 
где т/ (1) — количество феромона в #-м пункте /-го агента, который ещё не посетил и’ 
пунктов. 
Шаг 5. Если каждый агент посетил все пункты, то происходит обновление пу- 
тей (шаг 6) и перезапуск агентов (шаг 7). В противном случае — переход к шагу 3. 
Шаг 6. Обновление путей. Данный этап необходим для того, чтобы понизить ве- 
роятность в дальнейшем выбора таких пунктов назначения, включение которых даёт 
повышение ошибки построенной модели относительно других моделей, построенных 
без этого пункта. 
Шаг 6.1. Для каждого агента строится модель на основе пунктов, посещённых 
им. При этом происходит декодирование из последовательности номеров пунктов в 
двоичный код для определения тех признаков, которые следует оставить для построе- 
ния модели. Декодирование происходит исходя из двоичного набора В. Каждому 
пункту х/; (1 = ТощСЕ) /-го агента ставится в соответствие число а; по следующему 


принципу: 


1, если Б 7 = 


ый 


0,если Б г = 0. 


> 
1 


Шаг 6.2. На основе полученной битовой строки Н/= {а, 1 = ЪошеСЕ } и экспери- 
ментальных данных строится модель (например, на основе регрессии или нейросети). 
Шаг 6.3. Рассчитывается ошибка =; 


1х 2 
о, 2 
= 


где у; — исходные значения выходной переменной; у; рас. — расчётное значение выход- 
ной переменной по построенной модели; М№- количество экспериментов. 

Шаг 6.4. В соответствии с рассчитанной ошибкой количество феромонов каж- 
дого пункта, который посетил /-й агент, увеличивается на Ди): 


Ф/ (2) = АФ/ (1) + (#@).р), 


где т(0) — количество феромона в 1-м пункте /-го агента; 
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При этом Д?(#) определяется исходя из рассуждений, что больше феромона 
должно добавляться тем пунктам, использование которых даёт меньшую ошибку, при 
этом следует влияние значения самой ошибки на количество добавляемого феромона 
сделать не слишком существенным, поскольку может возникнуть зацикливание на 
одном пути: 


Ат7 (Е) = в > 
} 
где О — параметр, понижающий степень влияния ошибки модели =, построенной на 
основании признаков, входящих в путь /-го агента. 

Шаг 6.5. В начале пути у каждого пункта есть шанс быть выбранным. Чтобы 
постепенно удалить пункты, которые входят в худшие комбинации, ко всем путям 
применяется процедура испарения феромона: 

т) =т,(0.@-р). 

Шаг 7. Перезапуск агентов. На данном шаге производятся действия, аналогич- 
ные шагу 2. Однако в данном случае уже имеющаяся популяция распределяется по 
начальным пунктам, обнуляется список табу Ш151. Также на этом шаге выбирается луч- 
ший из путей, которые были получены при данном запуске агентов, и сохраняется в 
БеяРайй. 

Шаг 8. Проверка на останов. Осуществляется либо на основе времени моделиро- 
вания си’Тите (останов происходит при достижении предела тахТите), либо на осно- 
вании ошибки лучшей из полученных моделей (Ерьирид <=). Если проверка на останов 


дала положительный результат — переход к шагу 9, в противном случае — переход к 
шагу 3. 

Шаг 9. Останов. Определяется лучший путь, который является решением. Лучший 
путь выбирается на основе ошибок моделей, которые рассчитываются по принципу, 
описанному на шаге 4. 

Шаг 10. После останова и выбора наилучшего пути строится финальная модель, 
что позволяет обеспечить требуемую точность при меньшем количестве признаков, 
чем в исходном наборе. 

Таким образом, предложенный мультиагентный метод с непрямой связью меж- 
ду агентами на основе представления пунктов назначения в виде информативности 
отличается от предыдущего метода тем, что в данном методе узлами являются инфор- 
мативности, за счёт чего обеспечивается более детальное изучение пространства поиска, 
поскольку при таком подходе обеспечивается рассмотрение большего количества раз- 
личных комбинаций признаков. 


Эксперименты и результаты 


Предложенные методы были программно реализованы на языке программиро- 
вания среды МаЧаБ. С помощью разработанного программного обеспечения решалась 
задача прогнозирования коэффициента упрочнения деталей авиадвигателей после 
алмазного выглаживания [10], [11]. Также для сравнения работы предложенных ме- 
тодов с другими методами данная задача решалась с помощью канонического метода 
эволюционного поиска [12]. 

В качестве факторов, наиболее полно отражающих процесс алмазного выгла- 
живания деталей, в [10], [11] предлагается использовать: х/ — твердость материала, 
НВ, МПа; х> — среднее контактное давление в зоне деформирования, 4тах, МПа; хз — 
полуось эллипса касания в зоне упругого контакта, а, мм; хл — подача при выглажи- 
вании, 5, мм/об, х; — предел прочности, оз, МПа; хе — предел текучести материала, 4, 


МПа; х7 — показатель деформационного упрочнения, и; хз — теоретический коэффи- 
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техн 


циент концентрации напряжений от следов обработки, 0" ; хо — параметр исходной 


шероховатости детали, В |, мкм; х/о — сила выглаживания, Р,, Н; хи! — радиус сферы 


а1 > 
алмазного инструмента, Кеф, мм; х!2 — параметр шероховатости после выглаживания 
детали, Ка2, МКМ; Х/з — теоретический коэффициент концентрации напряжений натур- 


ной детали (образца), о’; х14 — диаметр образца в опасном сечении, 4, мм; х!5 — радиус 


скругления галтели или надреза, г, мм; х16 — относительный градиент первого главного 


-1 
напряжения, а, мм’. 


В [ПП были построены статистические модели коэффициента упрочнения, по- 
лученные на основе теории подобия. Ошибка таких моделей составила порядка 10% 
при расчёте коэффициента упрочнения [11]. 

С помощью разработанного программного обеспечения было получено несколько 
комбинаций наиболее информативных признаков, среди которых были отобраны две 
лучшие комбинации: (хз, Хз, Хл, Хз, Хи» Хиль Х16) И (Ж, ХТ, Хз» Хо Хи, Хр, Х16), полученные 
с помощью мультиагентного метода на основе представления пунктов назначения уз- 
лами и на основе представления пунктов назначения в виде информативности соот- 
ветственно. Среднее значение ошибки моделей, построенных на основе отобранных 
признаков, составило 5,18% и 5,05% соответственно, что значительно лучше по срав- 
нению с ошибкой полученных ранее моделей [11]. 

Сравнение работы предложенных мультиагентных методов с непрямой связью 
между агентами для отбора информативных признаков с работой канонического ме- 
тода эволюционного поиска представлено на рис. 1. 


0.07 т т т 
...-, АСО на основе представления пунктов узлами 
=—\4—АСО на основе представления пунктов в виде 
информативности 

Канонический метод эволюционного поиска 


0.065 


0.045 
0 


50 100 150 200 
Количество построений модели 


Рисунок 1 — Сходимость к оптимальному решению как функция ошибки 
прогнозирования модели = от количества построений модели (количество 
запусков: 20, количество информативных признаков: 9) 


Как можно видеть из рисунка, предложенные методы, основанные на мульти- 
агентном подходе, сходятся к оптимальному решению значительно быстрее, чем кано- 
нический метод эволюционного поиска, что свидетельствует об эффективности пред- 
ложенных мультиагентных методов с непрямой связью между агентами для отбора 
информативных признаков. 


Заключение 


В работе решена актуальная задача отбора информативных признаков на осно- 
ве мультиагентного подхода с непрямой связью между агентами. 

Научная новизна работы заключается в том, что впервые предложен мультиагент- 
ный подход с непрямой связью между агентами для отбора информативных признаков, 
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который за счёт представления пунктов назначения либо признаками, либо информа- 
тивностями, а также за счёт назначения меры приоритетности узлам, а не граням, 
позволяет обеспечить невысокую вычислительную сложность оптимизационного про- 
цесса, достигая при этом детального исследования пространства поиска, и как следст- 
вие, достигая необходимой точности прогнозирования моделей, полученных на основе 
отобранных наборов информативных признаков. 

Практическая ценность результатов работы состоит в том, что разработано прог- 
раммное обеспечение, реализующее предложенные методы отбора информативных 
признаков на основе мультиагентного подхода с непрямой связью между агентами, на 
основе которого решена задача моделирования коэффициента упрочнения деталей 
газотурбинных авиадвигателей после алмазного выглаживания. 
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О.0. Олйник, С.О. Суббопин 

Мультиагентний метод з непрямим зв?язком мёж агентами для вдбору 1нформативних ознак 
Виришено задачу в1дбору 1нформативних ознак. Запропоновано мультиагентн! методи вдбору 1нформативних 
ознак з непрямим зв’язком м1ж агентами на основ! представлення пункив призначення ознаками та у 
вигляд! 1нформативност!. Проведено експерименти з вирипення задач! в1дбору 1нформативних ознак для 
моделювання коефиценту змщнення деталей газотур@нних ав1адвигутв шсля алмазного вигладжування. 


А.А. Феушй, 5.А. биББойпт 

Мшбасеш Метод у ш@шесе СоппесНоп Бебуееп Асеп{5 Гог Ееафиге Зесйоп 

ТЬе Еабхе з@есНоп ргоет 15 з9]уед. Миареп{ те о4$ Юг Ееаёаге зе]есйоп у шаиесё соппесноп 
Бебмееп асеп{5 аге ргорозеа. ТЬе ехрегипеп!$ 10 зоуше оЁ ргоМет о то4е]| зупез1$ оРатепоше 4еа1$ 
Багдепте соеЁйстепе аге саглед ой. 
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